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高 核 图 书馆 服务 数据 的 信息 图 表达 与 实证 研究 
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摘要 : [目的 /意义 ] 将 高 校 图 书馆 日 常 工作 和 服务 中 产生 的 服务 数据 进行 整合 分 析 , 并 以 信息 图 的 形式 
进行 可 视 化 表达 ,让 用 户 能 更 清晰 、 容 易 理 解 服务 数据 及 数据 背后 的 意义 。[ 方 法 /过 程 ] 在 确定 信息 图 的 受众 
局 ， 清洗 、 整 合 、 分析, 提取 要 表达 的 主题 ,并 采用 合适 的 表现 方式 进行 
信息 图 的 绘制 。[ 结果 /结论 ] 实践 表明 ,合理 的 可 视 化 表达 有 助 于 更 清楚 了 解 图 书馆 各 类 资源 的 利用 情况 , 明 
0 预测 图 书馆 未 来 工作 的 开展 方向 ,为 图 书馆 的 各 项 工作 提供 决策 依据 。 
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1 引言 何 紧 跟 时 代 潮 流 ,提高 数据 处 理 能 力 ,扩展 数据 分 析 、 
知识 发 现 和 知识 挖掘 的 新 途径 ， 是 图 书馆 界 学 术 人 研究 
忆 随 着 社会 的 不 断 发 展 ,知识 的 更 新 速度 越 来 越 快 ， 。 人 员 需 要 不 断 思 考 的 重要 问题 " 
对 图 书馆 的 服务 工作 提出 了 更 高 的 要 求 , 图 书馆 全 面 随 关 各 项 业务 的 飞速 发 展 .高校 园 叫 久 的 服务 娄 
iEA 了 信息 化 服务 的 时 代 。 在 这 个 时 代 , 数 据 是 图 书 。 据 不 再 简单 指 购买 多少 图 书 .借阅 和 归还 了 多 少 纸 
饶 前 户 服务 能 力 和 市 场 竞争 力 的 关键 资产 ,除了 本 身 。 质 资 源 ,而 是 指 图 书馆 在 其 日 常服 务工 作 中 产生 的 各 
的 赐 源 数据 ,图 书馆 在 其 日 常服 务 中 也 会 产生 大 量 的 。 类 原始 数据 ,与 读者 的 行为 息息相关 ,是 图 书馆 资产 的 
数据 ,例如 读者 到 馆 情 况 、 图 书 借阅 流通 情况 、 门 户 网 重要 组 成 部 分 ,包含 流通 借阅 数据 .咨询 服务 数据 .各 
闻 风 间 情况、 电子 资 源 下 载 情 况 、 空 间 设 备 使 用 情况 。 类 系统 平台 数据 .各 类 社交 媒体 数据 等 。 这 些 服务 数 
等 6 这 些 服务 数据 背后 隐藏 着 很 多 有 价值 的 信息 ,如 果  ” 据 的 作用 日 益 凸 显 ,与 其 相关 的 研究 已 经 成 为 图 情 领 
能 对 其 进行 进一步 整合 分 析 , 并 采用 合理 的 可 视 化 形 。 域 的 热点 。 高 校 图 书馆 通常 会 统计 这 些 服务 数据 以 对 
式 进 行 表达 ,可 以 更 明确 读者 的 服务 需求 ,更 清楚 各 类 资源 和 用 户 的 各 种 现象 进行 描述 分 析 和 研究 ,从 而 揭 
资源 的 利用 情况 ,预测 图 书馆 未 来 工作 的 开展 方向 ,为 。” 示 资 源 .服务 .用 户 行为 的 现实 情况 .发展 趋势 和 一 般 
各 项 服务 提供 决策 依据 。 笔 者 结合 上 海 交通 大 学 图 书 。 规律 


站 o 


馆 的 实例 阐述 了 如 何 对 图 书馆 的 服务 数据 进行 分 析 和 2. 2 信息 图 概述 


整合 以 及 如 何 利 用 信息 图 对 服务 数据 进行 可 视 化 表 在 信息 爆炸 的 今天 ,人 们 接收 信息 的 方式 除了 传 
达 。 统 的 图 书 .报刊 ,杂志 之 外 ,还 有 来 自 互联 网 和 社交 媒 
体 。 人 们 的 阅读 习惯 发 生 了 显著 的 变化 , 越 来 越 多 的 

人 在 接收 信息 的 时 候 开 始 避 免 阅 读 枯 燥 、 乏 味 、 大 篇 幅 
2.1 高 校 图 书馆 服务 数据 概述 的 文字 。 俗 话说 “一 图 胜 千 言 ” ,视觉 传播 的 价值 和 效 

在 大 数据 时 代 , 数 据 作为 一 种 资源 如 何 开发 利用  ” 率 在 这 个 时 代 显 得 尤为 突出 。 

并 挖掘 其 价值 ,已 成 为 社会 各 个 领域 普遍 关注 的 问题 。 OA i es 
图 书馆 作为 社会 公共 服务 机 构 以 及 信息 传播 中 心 ,如 一” 。 信 息 图 (infographic ) 作 为 信息 禁 取 与 精华 提炼 


* 本 文系 上 海 交通 大 学 2015 年 文理 交 双 项目“ 基于 大 数据 的 数字 资源 智能 推送 系统 研究 "(项 目 编号 :15JCMY08 ) 研究 成 果 之 一 。 
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的 一 种 重要 方式 ,以 其 简明 扼要 直观 生动 的 特点 满足 
了 人 们 以 更 小 代价 更 快 获取 有 效 信息 的 心理 需求 , 开 
始 从 各 个 渠道 进入 人 们 的 生活 ,并 获得 了 爆发 式 流行 。 
调查 显示 ,在 Facebook 中 信息 图 被 阅读 的 机 会 是 纯 文 
字 内 容 的 30 倍 ,信息 图 的 转载 次 数 是 纯 文字 内 容 的 12 
倍 中 。 信 息 图 的 这 种 优势 与 人 类 大 脑 本 身 的 生理 特征 
有 紧密 的 关联 ,人 们 喜欢 阅读 信息 图 的 深层 原因 是 由 
于 人 脑 “更 喜欢 图 形 ,也 更 擅长 处 理 图 形 ""。 

对 于 信息 图 的 普遍 定义 是 “一 种 数据 的 可 视 化 表 
达 ” ,而 现在 信息 图 已 经 有 了 新 的 定义 :结合 了 数据 可 
视 化 .插画 .文字 和 图 像 来 讲述 完整 故事 的 较 大 型 的 平 
面 设计 中 。 它 用 于 快速 准确 地 表达 复杂 的 信息 ,扩大 
人 类 视觉 对 图 形 和 趋势 的 感知 办。 对 信息 图 的 定义 包 
售 琴 个 方面 :四 信息 图 是 由 文字 和 数据 经 过 加 工 转 换 
而 盛 的 图 片 , 也 就 是 说 信息 图 就 是 数据 \ 信 息 或 知识 的 
本 恶化 表现 形式 。@ 信 息 图 是 人 们 用 来 解释 数据 或 复 
玖 售 息 的 一 种 方法 和 手段 。 视 觉 是 最 强 的 信息 输入 方 
zE 姑 人 类 感知 周围 世界 的 最 强 方法 。 视 觉 化 传播 最 
厂 的 好 处 就 是 帮助 人 们 更 好 的 记忆 和 理解 所 要 表达 的 
秦 。 所 以 信息 图 的 作用 就 在 于 把 复杂 的 数据 ,信息 、 
通过 内 容 整 合 规划 和 视 沉 表达 ,从 而 达到 明确 、 有 

观 的 信息 传达 目的 。 
20 世纪 以 来 , 随 着 Flash、HTML .CSS 等 技术 的 发 


份 全 信息 图 报告 How Libraries Stack Up:2010 ,介绍 
公共 图 书馆 在 帮助 就 业 、 中 小 企业 发 展 、 家 庭 生活 各 方 
面 的 作用 ,反映 美国 经 济 、 社 会 和 文化 对 图 书馆 的 影 
响 ”。2013 年 开展 的 “加 拿 大 全 国 读书 运动 ”, 主办 
方 将 信息 图 作为 主题 宣传 的 载体 ,以 详细 数据 和 指示 
形象 绘制 出 阅读 在 心理 健康 .精神 减 压 和 情商 培养 等 
方面 的 积极 作用 ,直观 而 趣味 性 强 '。 

近年 来 ,国内 图 书馆 界 对 信息 图 也 进行 了 积极 的 
实践 。 早 在 2009 年 ,上 海 交 通 大 学 图 书馆 就 开始 用 漫 
画 代替 长 篇 的 文字 向 新 生 读者 说 明 如 何 进行 借 还 书 ， 
如 何 使 用 自助 打印 复印、 扫描 一 体 机 ,漫画 推出 后 受 
到 了 非常 多 读者 的 欢迎 ,这 算是 上 海 交 通 大 学 图 书馆 
对 图 书馆 服务 可 视 化 的 一 次 尝试 ,也 说 明了 对 于 大 部 
分 人 来 说 ,阅读 信息 图 无 疑 会 比 阅读 抽象 的 FAQ 和 无 
趣 的 使 用 说 明 更 能 让 读者 接受 。2013 年 上 海 图 书馆 
发 布 的 《上海 市 公共 图 书馆 2012 年 月 度 报告 》, 是 国内 
第 一 份 面向 公众 的 图 书馆 阅读 白皮书 。2014 年 ,厦门 
大 学 图 书馆 推出 了 淘宝 体 信息 图 “图 书馆 年 度 酷 数 
据 ” ,受到 用 户 的 大 量 转载 和 追捧 。2015 年 ,该 馆 举 办 
了 主题 为 “图 :时光 ”的 营销 活动 ,深入 挖掘 读者 数 
据 , 将 用 户 大 学 时 代 的 第 一 次 到 馆 时 间 及 借阅 的 图 书 、 
进 馆 次 数 .借阅 量 、 借 阅 记录 和 类 型 等 信息 串联 起 来 ， 
以 故事 性 的 信息 图 形式 进行 展示  。 上 海 交通 大 学 


3 给 息 图 也 出 现 更 加 丰富 的 形式 ,从 最 早 的 静态 信息 
浊 现 在 的 动态 信息 图 和 交互 式 信息 图 。 本 文 主要 
讨论 的 是 静态 信息 图 。 目 前 高 校 图 书馆 服务 数据 的 天 


-GO(1) 表 达 数字 和 概念 的 信息 图 ,用 于 表达 海量 村 
燥 的 统计 数字 和 难以 理解 的 文字 概念 ; 

(2) 表达 事物 的 运作 及 关系 的 信息 图 ,用 于 表达 
事物 的 运作 流程 事物 之 间 的 层级 以 及 相互 间 的 关系 ; 

(3) 表 达 时 间 、 地 点 、 人 物 的 信息 图 ,用 于 依据 时 
间 顺序 将 一 方面 或 多 方面 的 事件 串联 起 来 ,形成 相对 
完整 的 记录 体系 ,再 运用 图 文旦 现 给 用 户 "; 

(4) 标 签 云 信 息 图 ,标签 云 是 一 种 基于 搜索 引擎 
的 可 视 化 方式 ,可 以 显示 出 标签 的 热门 程度 。 

随 着 互联 网 的 发 展 ,信息 图 正 广泛 地 走 入 大 众 的 
视野 ,并 将 在 诸多 领域 具有 巨大 的 研究 与 发 展 空间 。 
笔者 仅 以 高 校 图 书馆 服务 数据 为 例 来 曾 述 信息 图 在 表 
达 和 传递 图 书馆 服务 相关 的 数据 .信息 和 知识 方面 起 
到 的 积极 作用 。 

2.3 ”信息 图 表达 在 图 书馆 的 发 展现 状 
2010 年 ,OCLC (联机 计算 机 图 书馆 中 心 ) 发 布 了 
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图 书馆 每 年 世界 阅读 日 都 会 准时 推出 读者 阅读 状况 报 
告 等 。 此 外 ,图 书馆 开始 将 一 些 新 推 服务 的 使 用 方式 
制 成 信息 图 ,发 布 在 微 信 公 众 号 、 微 博 等 社交 媒体 , 即 
达到 宣传 服务 .教导 服务 的 目的 ,又 便于 读者 在 朋友 圈 
转发 ,分享 ,从 而 收 到 更 好 的 服务 推广 效果 。 由 此 可 
见 , 图 书馆 已 经 开始 走 在 服务 与 数据 可 视 化 的 征途 中 。 


3 ”服务 数据 的 处 理 


数据 作为 原始 类 的 产品 经 过 加 工 、 整 理 和 分 析 可 
转化 为 有 意义 的 信息 和 知识 。 数 据 是 图 书馆 的 宝贵 财 
富 ,这 些 数据 真实 地 展示 了 图 书馆 的 整个 发 展 过 程 , 同 
时 也 充分 体现 了 图 书馆 的 服务 水 平和 发 展 方向 。 
3.1 服务 数据 的 采集 

相 比 依赖 于 小 数据 和 精确 性 的 时 代 , 大 数据 时 代 
更 强调 数据 的 完整 性 和 混杂 性 ,帮助 人 们 进一步 接近 
事实 的 真相 。 也 就 意味 着 ,人 们 会 收集 尽 可 能 多 的 数 
据 , 以 便 进行 深度 探讨 。 

图 书馆 在 做 服务 数据 采集 时 ,面临 的 首要 问题 就 
是 数据 的 来 源 , 图 书馆 需要 采集 哪些 数据 ,以 及 通过 什 
么 方式 采集 。 数 据 来 源 主要 包括 如 下 几 个 方面 : 
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(1) 图 书馆 自行 管理 的 系统 数据 库 , 如 读者 的 借 
阅 数据 等 ,这 类 数据 很 容易 采集 ,涉及 到 的 数据 种 类 也 
比较 多 ,如 :SqlServer .MySql ,Oracle .Access 等 。 若 要 使 
用 这 些 数据 ,就 需 将 有 用 的 数据 信息 导出 到 一 个 固定 
格式 文件 或 导入 到 一 个 统一 的 数据 库 中 。 

(2) 公 司 托管 的 系统 数据 库 , 有 些 图 书馆 购买 的 
系统 需要 搭建 在 公司 的 服务 器 上 ,使 用 公司 的 数据 库 ， 
如 APP 的 使 用 情况 统计 等 ,这 类 数据 可 以 通过 公司 提 
供给 图 书馆 的 开放 程序 接口 (API) 获取 。 

(3) 网 络 数据 ,比如 网 站 的 点 击 量 .访问 驻 留 数 
据 、 用 户 的 各 种 网 络 使 用 行为 数据 等 ,需要 利用 一 些 网 
络 工具 和 程序 进行 捕捉 和 收集 。 

(4) 还 有 一 部 分 衍生 数据 无 法 从 各 个 系统 中 获取 
的 = 如 图 书馆 在 信息 化 建设 之 前 存留 的 很 多 纸 质数 据 ， 
入 要 通过 定 的 数字 化 手段 将 纸 质数 据 转化 为 可 以 长 
:保存 且 有 助 于 数字 分 析 和 挖掘 的 电子 数据 。 又 比如 
9 办 馆 员 的 工作 量 数据 ,通常 会 依据 工作 时 长 ,工作 频 
率 通 行人 工 输入 或 表单 导入 的 方式 来 实现 获取 。 
3G@D 服务 数据 的 清洗 
在 追求 数据 完整 性 的 同时 也 要 付出 一 定 的 代价 ， 
后 量 的 大 幅 增加 会 造成 结果 的 不 准确 ,一 些 错误 的 
数 器 也 会 被 收集 。 不 同 来 源 的 数据 .不同 的 采集 方式 、 
不 同 的 数据 模式 ,都 会 导致 采集 的 元 数据 存在 着 重复 
数据 错误 数据 ,缺失 数据 ,不 一 致 数据 , 非 所 需 数据 、 
尼 蔚 数据 等 问题 。 这 些 不 满足 需求 的 元 数据 被 称 为 
“ 脐 数 据 " ,将 不 同 程度 影响 数据 分 析 应 用 的 效率 ,在 
进行 数据 分 析 之 前 要 将 脏 数据 清除 掉 , 这 个 过 程 就 是 
数 畅 清洗 的 过 程 。 数 据 清洗 在 整个 数据 应 用 过 程 中 是 
非常 重要 .不 可 缺少 的 一 个 环节 。 到 目前 为 止 对 数据 
清洗 还 没有 一 个 公认 的 定义 ,但 主要 内 容 大 体 相同 。 
一 般 来 说 ,只 要 是 有 助 于 解决 数据 质量 问题 的 处 理 过 
程 就 被 认为 是 数据 清洗 "”"。 数 据 清洗 一 般 会 经 过 5 
个 过 程 ,如 图 1 所 示 。 

@ 获 取 元 数据 ,分 析 数 据 存在 的 问题 ;@ 定 义 清洗 
规则 ,确定 清洗 方案 ;@ 选 择 数据 样本 验证 数据 清洗 方 
案 的 正确 性 和 清洗 效率 ,如 果 验 证 该 方案 不 可 行 则 重 
新 加 到 定义 清洗 规则 这 一 步 ;@ 进 行 数据 清洗 ;@ 将 清 
洗 过 的 数据 代替 原 有 数据 。 

数据 清洗 的 目的 是 检测 数据 本 身 的 非 清洁 和 数据 
间 的 非 清洁 , 吻 除 或 者 改正 它们 ,提高 数据 的 质量 1。 
逐一 对 所 采集 的 数据 进行 可 用 性 检查 ,主要 需要 做 的 
工作 是 过 滤 掉 无 序 无 关联 性 数据 .删除 错误 值 .补充 空 
缺 的 信息 以 及 修改 部 分 不 吻合 的 值 ,保留 下 有 价值 的 


评价 清洗 方案 


可 人 行 : 


图 1 数据 清洗 流程 


操作 性 强 的 数据 ,为 下 一 层 的 数据 整合 提供 前 提 准 备 。 
3.3 ”服务 数据 的 整合 与 分 析 

要 想 把 数据 可 视 化 ,就 必须 知道 它 表达 的 是 什么 ， 
数据 和 它 所 代表 的 事物 之 间 的 关联 既是 数据 可 视 化 的 
关键 ,也 是 全 面 分 析 数 据 的 关键 ,同样 还 是 深层 次 理解 
数据 的 关键 。 为 了 能 完整 展示 数据 以 及 数据 之 间 
的 关系 ,还 需要 对 数据 进行 整合 。 单 个 数据 表 中 数据 
往往 不 能 反映 一 种 行为 或 者 现象 的 全 貌 , 需 要 结合 其 
他 数据 源 中 的 数据 一 起 进行 分 析 , 这 里 的 数据 整合 5 
以 理解 成 是 对 数据 进行 组 织 .整理 .合并 和 完整 性 补 
充 。 

数据 的 采集 清洗 和 整合 都 是 数据 分 析 的 前 提 , 数 
据 分 析 的 根本 目标 是 根据 需求 从 数据 中 提取 有 用 的 知 
识 , 并 将 其 应 用 到 具体 的 领域 之 中 。 服 务 数据 经 过 整 
合 后 依然 数量 庞大 、 结 构 复 杂 , 让 人 摸 不 着 头绪 ,很 多 
隐藏 在 数据 背后 的 意义 需要 图 书馆 员 通 过 进一步 分 析 
才能 得 到 ,例如 通过 对 本 科 生 各 个 年 级 的 借阅 数据 进 
行 分 析 , 可 以 得 到 本 科 生 四 年 的 学 习 生 活 中 关注 点 产 
生 了 什么 样 的 变化 。 数 据 分 析 也 可 以 认为 是 对 数据 信 
息 内 涵 的 一 种 挖掘 。 
3.4 服务 数据 处 理 的 自动 化 实现 

图 书馆 的 日 常 工作 多 而 复杂 ,产生 的 服务 数据 种 
类 和 数量 也 日 益 繁多 ,实现 服务 数据 的 自动 化 处 理 对 
数据 资源 的 管理 ,数据 的 进一步 利用 、 提 高 工作 效率 ， 
具有 重要 的 现实 意义 。 

服务 数据 的 自动 化 处 理 主要 包括 数据 的 智能 采 
集 自动 整合 和 自动 统计 分 析 。 

各 种 服务 数据 常 以 多 种 类 型 渠道 和 形式 广泛 地 
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分 布 在 各 种 维度 层次 的 系统 数据 库 和 网 络 上 ,具有 数 
量 大 ,存储 分 散 . 类 型 格式 复杂 ,资源 组 织 异 构 ,粒度 层 
级 复杂 等 特点 ,智能 采集 通过 编写 程序 调用 接口 定期 
去 各 个 系统 和 途径 抓 取 各 种 来 源 的 数据 ,不 需 人 工 再 
去 一 个 个 系统 去 抽取 数据 ,可 以 设 定 一 个 期 限 ( 如 每 周 
或 者 每 个 月 ) 去 抽取 一 次 数据 。 同 时 可 以 过 滤 掉 一 部 
分 不 需要 和 无 效 的 数据 ,实现 初步 的 数据 清洗 。 

抽取 的 元 数据 存在 着 描述 语法 不 统一 ,数据 间 有 
冲突 ,数据 不 完整 等 问题 ,需要 借助 自动 化 程序 进行 交 
据 的 整合 。 自 动 整合 可 以 理解 是 基于 信息 提取 的 , 即 
从 存储 的 数据 进行 查询 ,匹配 所 需 的 数据 字段 与 实体 
关系 ,实现 数据 之 间 的 语义 关联 ,提取 这 些 数据 信息 ， 
并 以 相同 的 格式 进行 集中 的 存储 。 
本 自动 统计 分 析 基于 整合 后 的 服务 数据 ,为 用 户 使 
报 务 ,按照 编写 好 的 程序 ,提供 统一 的 应 用 界面 , 实 


WD 
现 数据 的 汇总 统计 查询 ,以 及 报表 生成 等 功能 ,方便 
用 局 效 得 名 类 统计 信息 。 


4 ”服务 数据 的 信息 图 表达 实例 
CD 如果 论 几 小 时 甚至 更 多 时 间 在 某 张 表格 或 某 个 数 
毁 上 , 谁 都 可 以 从 中 发 现 到 规律 或 是 启示 。 不 过 人 
们 通常 不 愿意 花 这 个 时 间 去 钴 研 细 节 。 他 们 不 想 看 原 
婚 讽 所 ,他 们 只 要 结果 ,大 部 分 用 户 都 相信 眼见 为 实 ， 
所 起 数 据 可 视 化 和 信息 图 就 是 为 他 们 服务 的 。 

< 简明 精 练 的 信息 图 可 以 帮助 馆 员 和 用 户 迅速 理解 
大 键 服务 数据 以 及 数据 要 表达 的 具体 意义 ,有 助 于 图 
书馆 员 为 图 书馆 确定 未 来 服务 发 展 的 方向 和 制定 发 展 

 】 


决策 。 同 时 ,也 可 以 激发 兴趣 ,吸引 更 多 的 馆 员 参与 到 
创意 构思 .问题 解决 的 过 程 中 来 。 本 章 将 结合 上 海 交 
通 大 学 图 书馆 的 实例 讲述 信息 图 的 表达 。 
4.1 信息 图 制作 

利用 信息 图 来 对 服务 数据 进行 可 视 化 表达 的 流 
程 ,如 图 2 所 示 : 


2 信息 图 制作 流程 


4.1.1 确定 目标 首先 需要 确定 目标 ,确定 信息 图 的 
受众 为 图 书馆 业界 同行 以 及 关心 图 书馆 服务 的 读者 ， 
要 表达 的 就 是 图 书馆 提供 的 服务 情况 及 成 效 。 

4.1.2 收集 资料 和 数据 ”将 图 书馆 服务 数据 分 为 业 
务 资源 .社交 媒体 三 类 ,分 别 对 数据 来 源 和 数据 内 容 
进行 表述 ,具体 如 表 1 所 示 。 根 据 不 同 的 来 源 采 用 不 
同 的 方法 进行 数据 的 采集 。 


© 表 1 服务 数据 来 源 及 内 容 描述 
分 类 数据 来 源 数据 内 容 描述 
业务 类 。 ”图 书馆 集成 信息 管理 系统 书目 信息 .读者 信息 , 借 还 书信 息 预约 信息 , 续 借 信息 .借阅 排行 等 
户 一 卡通 管理 系统 证 件 事务 处 理 (开通. 斩 停 .延期 .信息 变动 等 ) 次 数 . 离 校 处 理 次 数 .人 期 罚款 数量 、 赔 书 与 丢 书 赔款 图 
书 数量 等 
发 现 系统 检索 量 ,高 频 检索 记 
REID 图 书 自 助 借 还 系统 射频 标签 数量 读者 自助 借 还 次 数 等 
门禁 系统 入 馆 人 数 统计 


小 组 学 习 室 /会 议 室 预 约 系统 
图 书馆 各 类 自 建 网 站 
查 新 与 查收 查 引 服务 


WEB 访问 驻 留 数据 


小 组 学 习 室 /会 议 室 预约 次 数 .预约 人 数 使 


月 时 长 等 


科技 查 新 数 ,检索 论文 收录 数 .检索 论文 被 他 引 数 ,支持 各 类 人 才 计 划 申 报 数 、 支 持 各 类 奖项 申报 数 


咨询 服务 业务 咨询 .意见 反馈 次 数 
自助 打印 复印 扫描 系统 读者 自助 打印 .复印 .扫描 的 数量 
讲座 培训 系统 讲座 的 场 数 .参与 人 数 
馆 际 互 借 / 文 献 传递 系统 请 求 提 交 数 、 处 理 请求 数 ,请求 满足 数 .满足 率 
资源 类 外 购 数据 库 图 书馆 采购 的 各 类 电子 书 类 期刊 论文 类 ,视频 类 数据 库 , 数 据 内 容 包括 资源 容量 .IP 地 址 访问 信息 、 
户 的 在 线 时 长 、 下载 量 、 下 载 偏好 等 ,以 及 检索 .浏览 下载 等 用 户 行为 数据 
自 建 数据 库 具有 馆藏 特色 的 专题 数据 库 ,数据 内 容 包括 检索 .浏览 、 下 载 等 用 户 行为 数据 
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( 续 表 1) 
分 类 数据 来 源 数据 内 容 描述 
随 书 光盘 系统 光盘 下 载 次 数 .光盘 链接 请 求 数量 .光盘 满足 率 等 
多 媒体 资源 系统 音 、 视 频数 量 
社交 媒体 类 微 信 公众 平台 发 布 内 容 篇 数 、 阅 读 量 、 关 注 人 数 


图书 馆 微 博 


发 布 内 容 篇 数 、 阅 读 量 、 关 注 人 数 


区 | 


匀 书 馆 BBS 


书馆 留言 系统 


互动 数据 


留言 条 数 .回复 条 数 


4.1.3 处 理 数 据 对 数据 进行 清洗 与 整合 。 以 读者 。 年 1 月 这 段 时 间 内 的 读者 预约 元 数据 ,由 于 原 表 非 常 
预约 服务 数据 为 例 ,从 图 书馆 集成 管理 系统 抽取 2017 


庞大 ,此 人 处 截取 部 分 字段 和 记录 ,如 表 2 所 示 : 


表 2 读者 预约 信息 原始 表 
REC_KEY D REQUEST_ STATUS OPEN_ HOLD_ PICKUP_ -FILTER_S UB- LETTER_ LETTER_ 
NUMBER DATE DATE LOCATION LIBRARY STATUS DATE 

11757770000200001 ID282132 000261005 S 20170106 20170221 WTSKJ WTSKJ 02 20170221 

9537270000100034 ID281574 000261831 S 20170113 20170301 LTSKJ LTSKJ 02 20170301 

HR6060000100011 ID282524 000262197 Ww 20170126 0 TTSKJ WTSKJ 01 20170127 
A 500334100003 

1D240466 000262192 Ww 20170124 0 JTSKJ WTSKJ 01 20170124 


M79780000100001 


加 原始 表 中 有 许多 表达 不 清 的 字段 名 ,有 不 需要 的 
潜 吕 ,有 空 数据 ,也 有 不 能 理解 的 内 容 。 对 原始 数据 进 


需 矣 的 LETTER_STATUS( 发 信 状 态 ) LETTER_DATE 
( 懈 时 间 ) 字段 ,删除 空 记录 ,补充 了 记录 号 字段 以 


便于 统计 ,修正 了 记录 中 STATUS( 申请 状态 ) .PICKUP 
_LOCATION( 取 书 地 点 ) FILTER_SUB_LIBRARY( 
书 所 在 分 馆 ) 字 段 的 内 容 ,使 其 更 容易 被 理解 ,清洗 后 
的 数据 内 容 如 表 3 所 示 : 


表 3 ”清洗 后 的 读者 预约 信息 表 

内 部 号 读者 ID 申请 号 申请 状态 申请 时 间 预约 保留 时 间 取 书 地 点 。 ”图 书 所 在 分 馆 
11757770000200001 ID282132 000261005 Success 20170106 20170221 包 玉 刚 图 书馆 ” 包 玉 刚 图 书馆 

> » 09527270000100034 ID281574 000261831 Success 20170113 20170301 主 馆 主 馆 
四 ea 11186060000100011 ID282524 000262197 Wait 20170126 0 李 政 道 图 书馆 ” 包 玉 刚 图 书馆 
-和 11719780000100001 ID240466 000262192 Wait 20170124 0 徐汇 社 科 馆 。” 包 玉 刚 图 书馆 

人 
对 于 服务 数据 分 析 来 说 , 表 3 中 的 内 容 是 不 够 的 ， ”到 预约 书目 表 中 的 书目 信息 ,然后 再 使 用 SQL 语句 将 


可 能 还 需要 读者 信息 .预约 的 书目 信息 等 ,可 以 利用 读 
者 ID 查找 到 读者 信息 表 中 的 读者 信息 ,利用 申请 号 找 


读者 预约 信息 .读者 信息 、 预 约 书目 三 张 表 整 合 起 来 
(当然 有 可 能 需要 融合 更 多 的 表 ) ,如 表 4 所 示 : 


表 4 整合 后 的 读者 预约 信息 表 


记录 号 读者 姓名 学 院 书 名 分 类 身份 申请 状态 申请 时 间 取 书 地 点 。 ”图书 所 在 分 馆 
1 张 X 机 动 学 院 芳 华 I 本 科 生 Success 20170106 ” 包 玉 刚 图 书馆 ” 包 玉 刚 图 书馆 
2 王 X 利 媒 设 学 院 LATEX 入 门 TS 研究 生 Success 20170113 主 馆 主 馆 
3 汪 X 琛 文学 院 浪潮 之 匮 F 本 科 生 Wait 20170126 李 政 道 图 书馆 ” 包 玉 刚 图 书馆 
4 李 X 月 朋 建 学 院 巨人 的 陨落 I 教 职 工 Wait 20170124 徐汇 社 科 馆 ” 包 玉 刚 图 书馆 
4.1.4 提取 主题 对 整合 后 的 数据 利用 Excel 等 工具 ”4.1.5 设计 并 实现 信息 图 根据 提取 的 主题 设计 并 实 


进行 分 析 统 计 , 根 据 目标 提取 主题 ,这些 统计 分 析 的 结 
果 对 图 书馆 购买 图 书 资源 、. 开 展 主题 书展 .开展 学 院 宣 
传 活动 等 都 会 提供 决策 依据 和 借鉴 意义 。 以 读者 预约 
信息 为 例 , 提 取 预 约 总 量 、 跨 校区 预约 量 、 预 约 最 多 的 
书 、 跨 校区 预约 最 多 的 图 书 等 信息 。 


现 信 息 图 ,如 图 3 所 示 , 通 过 信息 图 用 户 可 以 清楚 地 知道 
图 书 预约 的 整体 情况 ,有 哪些 取 书 的 地 点 可 以 选择 ,最 受 
欢迎 的 预约 书 是 哪些 ,路 校区 的 预约 情况 如 何等 信息 。 

此 外 ,设计 和 实现 信息 图 往往 比 想象 的 更 难 ,掌握 
一 些 策略 可 以 帮助 设计 师 设计 出 更 精美 的 信息 图 。 
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总 预约 量 


3.9 万 


| 路 校 区 借阅 1.7 万 朋 ， 累 计 奔 跑 约 64 万 公里 ， 相 当 于 绕 地 | 
| 球 16 圈 ，《 人 类 简 史 》 奔 跑 约 1960 公 里 ， 相 当 于 46.5 次 马 | 


1 拉 松 比赛 ， 堪 称 书 中 劳模 。 ) 
全 am am es mm emp am em emp em em ep em ma es em em ae im 


3 图 书 预约 情况 信息 图 


(1) 确 定 信息 图 的 整体 风格 ,配色 方案 。 
(2) 精确 是 信息 图 设计 最 重要 的 要 素 。 比 如 饼 图 
的 各 部 分 必须 严格 按照 比例 绘制 ,总 和 必须 为 100% 。 
从 图 4 饼 图 可 以 看 到 交大 图 书馆 证 件 事务 处 理 的 各 类 
型 事件 所 占 的 比例 。 
OO) 


园 卡 处 理 80% 


(3) 新 鲜 的 话题 ,选择 一 个 用 户 有 兴趣 且 之 前 不 
够 了 解 的 话题 领域 ,尝试 提供 一 些 新 的 .出 人 意料 的 信 
息 给 读者 。 上 海 交 通 大 学 图 书馆 (以 下 简称 "交大 ”) 
每 年 接待 读 者 百 万 人 次 ,他 们 享受 图 书馆 提供 的 便捷 
服务 , 却 不 知道 图 书馆 每 年 的 用 水 用 电 甚至 而 纸 的 用 
量 有 多 少 。 用 信息 图 展示 这 些 数据 如 图 5 所 示 。 并 以 
读者 熟悉 的 交大 思源 湖 , 交 大 校园 为 比较 对 象 ,对 读者 
来 说 既 新 鲜 又 能 激发 其 环保 意识 。 


Ey 


51 332m3 323 万 千瓦 /时 150 万 米 
访 全 
pa a CC 
二 AAA eo 二 == 
A- A CA=- 强 = 
| 2 个 思源 湖 | | 煤 1163.6 吨 绕 交 大 192 图 


图 5 图 书馆 碳 排放 信息 图 
(4) 尽 可 能 多 做 可 视 化 ,使 得 信息 图 快速 易 读 。 


< 十 
pl 赔 书 与 丢 书 2.1% 2017 将 主页 访问 量 数据 用 图 的 形式 表现 出 来 ( 见 图 6), 读 

清 期 罚款 4.4% 证 件 事 务 AH 3 Se 
© 6 鸡 者 可 以 很 容易 了 解 到 主页 访问 的 整体 情况 , 比 表 格 的 

图 
(ee@] 离 校 处 理 13.5% 形式 更 加 清晰 易 读 。 
©O | 
CD 4 证 件 事务 类 型 信息 图 
CN 表 5 ”主页 访问 量 按 月 统计 (单位 :人 次 ) 
A 1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 12 月 总 量 
访 量 268 414 251 208 384 144 404 412 423 594 359 268 325 118 196 076 399 627 434 655 458 286 447 636 4 352 438 
y 
= 入 
Ce. 
4 和 馆 际 互 借 图 书 
. HL La 
30 万 没有 你 借 不 到 2017 年 
只 有 你 想不到 申请 量 :7 999 次 
完成 量 : 06; 

| :90.1 必 世 


1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 12 月 月份 
图 6 主页 访问 量 信息 图 


(5) 减 少 文字 ,把 握 重 点 。 一 般 来 说 信息 图 设计 
需要 把 图 的 重点 在 几 秒 内 传达 给 读者 ,图 7 有 效 地 向 
读者 表达 了 馆 际 互 借 会 尽 可 能 利用 各 种 交通 方式 将 读 
者 在 本 馆 借 不 到 的 图 书 送 到 他 们 的 身边 ,同时 告诉 读 
者 这 种 方式 借 到 自己 想 要 的 书 的 成 功率 有 多 少 。 

(6) 借 用 成 功 前 例 ,可 以 借鉴 一 些 已 被 读者 广泛 接 
受 的 成 熟 的 信息 可 视 化 方案 ,比如 云图 是 展示 关键 词 的 
一 种 典型 方式 ,交大 图 书馆 的 发 现 系统 (思源 探索 )2017 
年 的 高 频 检 索 词 就 以 云图 的 方式 展示 , 见 图 8。 
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ou p> 


7 馆 际 互 借 服务 信息 图 


数据 分 析 
Android 研究 
本 策略 搬 设计 
Linux 教学 口语 Java Python 


中 央 财 经 大 学 法 学 院 


张小平 学 校 教学 研究 交 
Austin 高 等 学 校 教 生 研究 
规则 与 潜 规 则 ”教学 方法 手册 


语言 学 概论 
教师 ”毕业 论文 a 


8 ”发现 系统 高 频 检索 词 信息 图 


钱 吟 ， 曲 建 峰 . 高 校 图 书馆 服务 数据 的 信 


息 图 表达 与 实证 研究 [J]. 图书 情报 工作 ,2018 ,62(19 ) :39 -45. 


(7) 趣 味 性 ,制作 者 可 以 采用 漫画 、 经 典 台 词 . 谈 谐 
流行 用 语 等 方式 增添 趣味 性 ,如 果 读 者 多 数 为 年 轻 人 ， 
就 要 多 加 一 些 吸引 年 轻 人 的 元 素 “” 。 

4.1.7 核对 信息 图 内 容 ”准确 无 歧义 地 表达 信息 是 
信息 图 的 基本 要 求 ,确保 传达 的 数据 和 信息 内 容 真实 准 
确 ,如 果 没 有 问题 就 可 以 发 布 了 。 

4.2 ”信息 图 的 发 布 

信息 图 创建 完毕 后 就 可 以 分 享 给 读者 。 可 以 通过 多 
个 渠道 发 布 ,如 博客 .社交 网 站 微 信 、 平 面 媒体 等 。 交 大 
图 书馆 多 采用 微 信和 微 博 的 方式 进行 发 布 ,原因 在 于 在 微 
信和 微 博 上 分 享 内 容 非 常 的 简单 ,而 且 图 像 和 视频 等 多 媒 
体 的 呈现 和 获取 都 很 容易 。 根 据 统计 ,截至 2017 年 12 月 
交大 图 书馆 的 官方 微 信 关 注 人 数 7 684 人 ,官方 微 博 关注 

人 数 9 849 人 ,良好 的 受众 数量 也 有 助 于 信息 图 的 传播 。 
将 服务 数据 以 信息 图 的 方式 进 了 表达 能 让 读者 更 了 解 图 
打 寺 的 服务 状况 ,受到 了 读者 的 广泛 好 评 和 欢 迎 。 


总 结 与 展望 


中 服务 数据 作为 图 书馆 的 宝贵 财富 ,通过 整合 分 析 ， 
丁 卫 充分 表达 图 书馆 服务 的 内 涵 价值 ,并 对 图 书馆 的 
坟 张 发 展 方向 给 予 指引 ,而 信息 图 作为 互联 网 大 数据 
时 8 信息 有 效 传达 的 有 力 工具 ,无 疑 将 会 进化 成 新 的 
媒 仿 形式。 

"利用 信息 图 对 图 书馆 的 服务 数据 进行 可 视 化 的 表 
过 条 传播 ,有 很 多 的 优势 ,但 也 有 其 缺陷 ,例如 如 果 信 
制作 者 不 能 够 正确 理解 要 传播 的 数据 ,就 很 可 能 会 
误 学 用 户 ,数据 的 错误 和 误导 会 降低 用 户 的 信任 度 ,对 
图 划 馆 的 品牌 造成 不 良 的 影响 。 因 此 如 何 扬长 避 短 ,有 
效 拒 对 服务 数据 进行 可 视 化 表达 也 是 一 个 值得 图 书馆 
员 长 期 研究 的 课题 
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Abstract: [Purpose/significance | This paper aims to integrate and analyze the service data produced in daily work 


and service of the university library, and use infographic to visualize these service data, so that users can understand the 


service data and the meaning behind the data more easily. 


| Method/ process | After determining the audience of the info- 


graphic , it collects service data from various ways, then cleans, integrates and analyzes these data, extracts the topics to be 


expressed ，and uses an appropriate way to draw the infographic. [ Result/ conclusion | Practice shows that through reasonable 


visualization we can understand the utilization of all kinds of resources in the library much better, make clear the reader’s 


demand ,forecast the direction of the future work of the library, and provide the decision -making basis for the future work. 
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